JSAI2026 大規模言語モデルを用いた対話からのユーザ嗜好を考慮した知識獲得
テーマ
対話ログからユーザの嗜好を抽出し、ユーザ嗜好知識グラフ(UPKG)として構造化する研究
目的は、対話AIのパーソナライズを「ブラックボックスな埋め込み」ではなく、説明可能で可搬な知識として扱うこと LLMパーソナライズ
関連研究
テキストからの嗜好抽出
嗜好の解像度が不足
階層的興味モデリング
提案
ユーザ嗜好知識グラフ
嗜好軸、サブ嗜好軸
スキーマを独自作成
Liking(感情)
Wanting(欲求)
Need(実利)
手法
対話履歴をLLMに入力し、嗜好スキーマに従って明示的嗜好をJSON形式で抽出する
抽出対象は、対象エンティティ、嗜好軸、サブ嗜好軸、極性、強度、文脈タグ
暗黙的嗜好は、発話の背後にある価値観・習慣・行動原理として自然言語で推論する 最終的に、明示的嗜好エッジと暗黙的嗜好ノードを持つUPKGを構築する
データ
面白い結果
単一モデルで全部やるより、モデルの得意領域を分ける方がよさそう
GPT-4o: 強度や文脈を肉付け
「好きではないが必要」「欲しいが好きではない」のような矛盾を、同一対象に対して保持できる
暗黙的嗜好を自然言語ノードとして残すことで、固定スキーマでは拾えない価値観も扱える Gemma 3も一部指標でGPT-4o-miniを上回り、ローカルLLM利用の可能性を示した 課題: エンティティ境界決定ミス
シェイクの件
例として "vanilla milkshake" という嗜好対象が出てくる
正しくは、ユーザが好みとして述べた対象を "vanilla milkshake" 全体として取るべき場面がある
しかしLLMが "milkshake" だけを抽出してしまう場合がある
これは、嗜好対象の粒度をどこで切るかが難しい、という問題 回避・否定表現の扱い
「タバコをやめたい」のような表現では、嗜好の対象をどこに置くかが難しい
「タバコ」への Negative Wanting なのか
「禁煙」への Positive Wanting なのか
同じ発話でも、グラフ上のエンティティと極性が変わってしまう
まとめ
写真
このスライドいいな!daiiz.icon